عاملها موجودات نرمافزاری هستند که بطور پیوسته و خود مختار در یک محیط که برای آن طراحی شدهاند کار میکنند. برای عاملها نیازهایی از قبیل واکنشی بودن نسبت به کنشهای محیطی، خود مختاری در انتخاب مسیر و ادامه آن، قابلیت تطبیق و یادگیری و ... ضروری به نظر میرسد. امروزه مطالعه سیستمهای مبتنی بر عاملها به یک موضوع مهم آکادمیک تبدیل شده است که کاربردهای تجاری و صنعتی فراوانی را نیز دربر دارد. در سیستمهای چندعامله، چندین عامل هوشمند با قابلیت برقراری ارتباط با یکدیگر، جهت رسیدن به مجموعهای از اهداف، با هم همکاری میکنند. بدلیل پیچیدگیهای موجود در محیطهای چندعامله پویا و متغیر نیاز به روشهای یادگیری ماشین در چنین محیطهایی احساس میشود. اتوماتای یادگیر یک مدل انتزاعی است که تعداد محدودی عمل را میتواند انجام دهد. هر عمل انتخاب شده توسط محیطی احتمالی ارزیابی میگردد و پاسخی به اتوماتای یادگیر داده میشود. اتوماتای یادگیر از این پاسخ استفاده نموده و عمل خود برای مرحله بعد را انتخاب میکند. در این مقاله با استفاده از بستر تست شبیهسازی فوتبال روباتها به بررسی کارآیی اتوماتای یادگیر در همکاری بین عاملهای عضو یک تیم پرداخته شده است. بدلیل وجود تعداد حالات بسیار زیاد در دامنههای چندعامله پیچیده، داشتن روشی برای عمومیسازی حالات محیطی، امری ضروری است چرا که انتخاب مناسب چنین روشی، در تعیین حالات و اعمال عامل نقشی تعیین کننده دارد. در این مقاله همچنین به معرفی و پیادهسازی تکنیک "بهترین گوشه در مربع حالت" پرداخته شده است. با استفاده از این روش فضای حالات پیوسته و بسیار وسیع عامل به فضای حالات گسسته و محدود نگاشته میشود. کارآیی این تکنیک در عمومیسازی حالات محیطی در یک دامنه چند عامله همکاری گرا مورد بررسی قرار گرفته است.